神经网络嵌入的成功使人们对使用知识图进行各种机器学习和信息检索任务产生了重新兴趣。特别是,基于图嵌入的最新建议方法显示了最先进的性能。通常,这些方法编码潜在评级模式和内容功能。与以前的工作不同,在本文中,我们建议利用从图表中提取的嵌入,这些嵌入结合了从评分中的信息和文本评论中表达的基于方面的意见。然后,我们根据亚马逊和Yelp评论在六个域上生成的图表调整和评估最新的图形嵌入技术,优于基线推荐器。此外,我们的方法具有提供解释的优势,该解释涉及用户对推荐项目的基于方面意见的报道。
translated by 谷歌翻译
神经网络嵌入的成功使人们对使用知识图进行各种机器学习和信息检索任务产生了重新兴趣。特别是,基于图形嵌入的当前建议方法已显示出最新的性能。这些方法通常编码潜在的评级模式和内容功能。与以前的工作不同,在本文中,我们建议利用从图表中提取的嵌入,这些嵌入结合了从评分中的信息和文本评论中表达的基于方面的意见。然后,我们根据亚马逊和Yelp评论在六个域上生成的图表调整和评估最新的图形嵌入技术,优于基线推荐器。我们的方法具有提供解释的优势,该解释利用了用户对推荐项目的基于方面的意见。此外,我们还提供了使用方面意见作为可视化仪表板中的解释的建议的适用性的示例,该说明允许获取有关从输入图的嵌入中获得的有关类似用户的最喜欢和最不喜欢的方面的信息。
translated by 谷歌翻译
Explainable artificial intelligence is proposed to provide explanations for reasoning performed by an Artificial Intelligence. There is no consensus on how to evaluate the quality of these explanations, since even the definition of explanation itself is not clear in the literature. In particular, for the widely known Local Linear Explanations, there are qualitative proposals for the evaluation of explanations, although they suffer from theoretical inconsistencies. The case of image is even more problematic, where a visual explanation seems to explain a decision while detecting edges is what it really does. There are a large number of metrics in the literature specialized in quantitatively measuring different qualitative aspects so we should be able to develop metrics capable of measuring in a robust and correct way the desirable aspects of the explanations. In this paper, we propose a procedure called REVEL to evaluate different aspects concerning the quality of explanations with a theoretically coherent development. This procedure has several advances in the state of the art: it standardizes the concepts of explanation and develops a series of metrics not only to be able to compare between them but also to obtain absolute information regarding the explanation itself. The experiments have been carried out on image four datasets as benchmark where we show REVEL's descriptive and analytical power.
translated by 谷歌翻译
这项工作提出了一种新的方法,可以使用有效的鸟类视图表示和卷积神经网络在高速公路场景中预测车辆轨迹。使用基本的视觉表示,很容易将车辆位置,运动历史,道路配置和车辆相互作用轻松包含在预测模型中。 U-NET模型已被选为预测内核,以使用图像到图像回归方法生成场景的未来视觉表示。已经实施了一种方法来从生成的图形表示中提取车辆位置以实现子像素分辨率。该方法已通过预防数据集(一个板载传感器数据集)进行了培训和评估。已经评估了不同的网络配置和场景表示。这项研究发现,使用线性终端层和车辆的高斯表示,具有6个深度水平的U-NET是最佳性能配置。发现使用车道标记不会改善预测性能。平均预测误差为0.47和0.38米,对于纵向和横向坐标的最终预测误差分别为0.76和0.53米,预测轨迹长度为2.0秒。与基线方法相比,预测误差低至50%。
translated by 谷歌翻译
与其他技术(例如电感回路,雷达或激光器)相比,使用摄像头进行车速测量的成本效益要高得多。但是,由于相机的固有局限性提供准确的范围估计值,因此准确的速度测量仍然是一个挑战。此外,基于经典的视觉方法对相机和道路之间的外部校准非常敏感。在这种情况下,使用数据驱动的方法是一种有趣的选择。但是,数据收集需要一个复杂且昂贵的设置,以在与高精度速度传感器同步的相机中录制视频,以生成地面真相速度值。最近已经证明,使用驾驶模拟器(例如Carla)可以用作生成大型合成数据集的强大替代方案,以实现对单个摄像机的车辆速度估算的应用。在本文中,我们在不同的虚拟位置和不同的外部参数中使用多个摄像机研究相同的问题。我们解决了复杂的3D-CNN体系结构是否能够使用单个模型隐式学习视图速度的问题,或者特定于视图的模型是否更合适。结果非常有前途,因为它们表明具有来自多个视图的数据报告的单个模型比摄像机特异性模型更好地准确性,从而铺平了迈向视图的车辆速度测量系统。
translated by 谷歌翻译
由于需要快速原型制作和广泛的测试,模拟在自主驾驶中的作用变得越来越重要。基于物理的模拟使用涉及多个利益和优势,以合理的成本消除了对原型,驱动因素和脆弱道路使用者的风险。但是,有两个主要局限性。首先,众所周知的现实差距是指现实与模拟之间的差异,这阻止了模拟自主驾驶体验实现有效的现实性能。其次,缺乏有关真实代理商的行为的经验知识,包括备用驾驶员或乘客以及其他道路使用者,例如车辆,行人或骑自行车的人。代理仿真通常是根据实际数据进行确定性,随机概率或生成的预编程的,但它不代表与特定模拟方案相互作用的真实试剂的行为。在本文中,我们提出了一个初步框架,以实现真实试剂与模拟环境(包括自动驾驶汽车)之间的实时互动,并从多个视图中从模拟传感器数据中生成合成序列,这些视图可用于培训依赖行为模型的预测系统。我们的方法将沉浸式的虚拟现实和人类运动捕获系统与Carla模拟器进行自主驾驶。我们描述了提出的硬件和软件体系结构,并讨论所谓的行为差距或存在。我们提出了支持这种方法的潜力并讨论未来步骤的初步但有希望的结果。
translated by 谷歌翻译
口语关键字发现(KWS)处理音频流中的关键字的识别,并且由于几年前深度学习引入的范式转换,这已经成为一种快速增长的技术。这使得在无数的小型电子设备中迅速嵌入深度KW,与语音助手的激活一样不同的目的。前景表明这项技术的社会利用方面持续增长。因此,深刻的KW已经成为言语科学家之间的热门研究课题并不令人惊讶,他们不断寻找KWS性能提高和计算复杂性降低。这篇论文激励了本文,我们将文献综述融为深口语KW,以协助对这项技术感兴趣的从业者和研究人员。具体而言,这一概述通过覆盖对深kWs系统的彻底分析(包括语音特征,声学建模和后处理),鲁棒性方法,应用,数据集,评估指标,深kWs系统和视听kws的性能进行全面分析。本文执行的分析允许我们识别未来研究的许多方向,包括从自动语音识别研究和方向上采用的方向,这些研究和对口语问题的问题是独一无二的。
translated by 谷歌翻译